暴雪皮克斯老兵的AI社交实验：声音匹配，MAU破260万，估值1.5亿,lol 皮克斯

允中发自凹非寺
量子位 | 公众号 QbitAI

AI正在杀死社交，但有人想用AI救回它。

想象一下：你在社交App刷到一张近乎完美的头像，点开主页，自我介绍幽默且真诚。

你发去消息，对方秒回，字里行间恰到好处。

但这种“完美”背后，隐约透着一丝冷意，不禁产生质疑：这张脸是生成的吗？这段话是Agent代写的吗？

照片可以P、视频可以合成、文字可以由AI实时润色，社交产品的底层假设——“信息可信度”正在全面崩塌。

在这一背景下，一款名为森森（Gensen）的产品给出了一个反直觉的答案。今年春节，这款主打“声音匹配”的产品杀入iOS社交榜前20，MAU突破260万

它的缔造者李哲羽曾在暴雪娱乐参与《魔兽世界》的开发工作，在皮克斯（Pixar）参与多个动画项目，发自内心认为：

唯有声音，是无法被AI轻易代偿的“最后真实信号”。

AI让一切都可以伪装，语音可能是最后的“真实信号”

现在AI让“自我呈现”这件事变得越来越容易。

照片可以P，视频可以合成，文字可以由AI助手实时生成。你在社交App上看到的那个人，也可能不是真的。

过去十年，社交产品的匹配逻辑经历了几次迭代：陌陌用位置，Tinder用照片，Soul用标签。

但不管形式怎么变，它们都建立在同一个假设上：用户提供的信息是可信的。

然而，这个假设正在崩塌。

因为今天，这些信息载体正逐渐失去可信度。

于是一个问题开始浮现：如果展示型信息越来越不可靠，社交匹配还能依赖哪些数据？

有一个产品给出了一个不同的答案：声音

语音社交产品森森（Gensen）今年春节期间进入了iOS社交榜前20，最高触及第17位，和Soul、陌陌、Uki等产品同榜，MAU突破260万。

相比榜单成绩，更值得关注的是它选择的技术路径。

在大多数产品用AI帮助用户“包装自己”的时候，森森做了一件相反的事：用AI去理解用户

这不是技术层面的判断，而是产品哲学层面的选择。

森森创始人李哲羽表示：

问卷测出来的是你想成为的人，声音暴露的是你真正是什么人。我们选择相信声音。

森森的创始人李哲羽曾在暴雪娱乐参与《魔兽世界》的开发，在皮克斯（Pixar）参与多个动画项目。

他对“什么让人与人产生真实连接”这个问题想了很久。他的答案是：不是“展示自己”，而是“一起经历一件事”。

而声音，是这个“一起经历”过程中最真实、最丰富的信息载体。

一个人说话的语调、语速、停顿的时机、笑声的频率，这些信号比他本人说的内容本身承载了更多关于“他是谁”的信息。而且这些信号是实时的，无法编辑，也无法让AI代替。

森森的核心逻辑可以用一句话概括：

用游戏创造真实互动场景，用声音作为行为信号，再用AI建模人格特征。

为什么是声音？

因为在AI几乎可以伪造一切的时代，语音仍然具有一个独特特性：实时性

照片可以生成，视频可以合成，文字可以编辑。但当两个人在实时语音房间里交流时，包括语调的起伏、停顿的节奏、笑声的频率、情绪的变化等，这些几乎无法提前设计，也很难伪装。

这些信号在语言学中被称为副语言信号（Paralinguistic signals）。它们往往比语言本身更能反映一个人的性格和情绪状态。

年轻人在语音游戏里重新做回自己

如果你和今天的大学生聊社交，会听到一个高频词：营业。

“又要开始营业了”，这是很多年轻人打开社交App时的心理状态。

他们要精心挑选照片、编辑自我介绍、想一个不尴不尬的开场白、维持一段可能毫无营养的对话。

整个过程更像是在经营一个理想人设，而不是关注、了解、和沉浸在认识一个人的过程。

这种疲劳感不是某一款产品的问题，而是整个“自我呈现式社交”的结构性问题。

如果社交的前提是“展示自己”，它就不可避免地会变成一种劳动。而在AI时代，这种劳动变得更荒谬。因为你精心经营的人设，对面也是精心经营的人设，可能还有AI的辅助加持。

然而，年轻人并非不想社交，他们只是厌倦了“表演式社交”。

你会发现一个有趣的现象：同样一群在社交App和工作软件上懒得回消息的年轻人，在线下剧本杀、狼人杀、派对游戏里可以开心地玩一个晚上，结束后加一堆微信好友。为什么？因为在游戏里你不需要“营业”，你只需要做你自己。

森森做的事情很简单：用户无需“展示”自己，只提供一个场景让他们去“做自己”。

用户在森森任意进入一个3D语音派对房间，和陌生人一起玩游戏——森森酒馆、海龟汤、电波同频和星卡大乱斗……

这些游戏有一个共同特点：它们都需要你开口说话，都需要你随时表达观点、做出判断、展示情绪。

注意，这里的“展示”和社交App所说的“展示”本质不同。

在社交App上，你展示的是你想让别人看到的样子。

而在游戏里，你展示的是你本能的反应，例如：玩海龟汤时你的推理方式，玩森森酒馆时你撒谎被抓包时的表演策略，玩电波同频时你对一个词的直觉感受。你没时间也没必要“演”，因为游戏本身就在要求你做真实的反应。

而这一切都发生在语音环境中。

AI在后台做什么

有意思的是，森森并没有回避技术，它把AI用在了一个完全不同的方向上。

许多产品用AI帮助用户“包装自己”，比如AI修图、AI生成开场白、AI代写回复。而森森更关注的是如何利用技术提升互动本身的匹配效率

在用户授权和隐私保护机制下，当用户在语音房间参与游戏互动时，系统会对语音交流中的一些匿名化特征信号进行统计建模，主要包括两个维度：

表达方式相关的声学特征

语言表达模式

系统会在不涉及具体语音内容存储的情况下，对这些特征进行模型训练与分析，从而形成更加贴近真实互动风格的匹配参考。

对于用户来说，整个过程并不需要额外操作，你无需填写复杂问卷，也无需做性格测试。用户只是参与游戏互动，系统则在后台不断优化匹配体验，帮助用户更容易遇到聊得来的人。

李哲羽表示，“我们不是在做语音聊天室加小游戏。我们在用AI理解人的声音，用游戏暴露人的性格，用性格来匹配连接对的人。”

游戏成为社交的“自然实验室”

来看一个具体的用户场景，想象一局海龟汤游戏。

出题者说：“有一匹马去餐馆点了一碗鱼汤，它喝完汤就哭了，为什么？”房间里有5个陌生人，开始通过语音提问。有人上来就问：“他是不是之前在海上遇过险？”——这个人思维跳跃，喜欢直达结论。有人从细节入手：“马不会说话，他是怎么点汤的？”——这个人严谨、习惯建立完整边界。还有人说：“这个汤好喝吗？”——全场爆笑，气氛瞬间轻松下来。

短短十分钟，5个陌生人的思维方式、表达风格、社交性格已经自然呈现。这就是森森想做的事情：游戏提供场景，让用户尽情做自己

这套逻辑是否成立？用户已经用脚投了票。

春节期间社交榜17、MAU 260万、估值1.5亿美元、累计融资超4500万美金（约3.1亿元人民币），A16Z和腾讯已表达投资意向。

目前，森森在上海和Palo Alto设有双总部，美国版Gensen正在做最后的上线准备。

但更值得关注的不是数字本身，而是这些数字反映的产品结构。

派对游戏是天然的裂变场景，一个人玩不起来，必须拉朋友一起。语音互动让“弱关系”到“强关系”的转化路径大幅缩短，AI匹配让你遇到的人真的聊得来。

三者组合，形成了产品的有机增长飞轮。

回到最初的问题：如果AI让照片、视频、文字都失去了可信度，社交还剩下什么？

在AI越来越擅长“生成内容”的时代，理解真实行为或许会成为下一代社交产品的关键能力。

声音，可能是这件事的入口，也许这才是社交本来该有的样子。